视觉变压器(VIT)竞争替代卷积神经网络(CNN),以完成医学成像中的各种计算机视觉任务,例如分类和分割。尽管CNN对对抗攻击的脆弱性是一个众所周知的问题,但最近的作品表明,VIT也容易受到此类攻击的影响,并且在攻击下遭受了重大的绩效退化。 VIT易于精心设计的对抗样品的脆弱性引起了人们对它们在临床环境中的安全性的严重关注。在本文中,我们提出了一种新型的自我浓缩方法,以在存在对抗性攻击的情况下增强VIT的鲁棒性。拟议的自我启发变压器(SEVIT)利用了一个事实,即通过VIT的初始块学到的特征表示相对不受对抗性扰动的影响。根据这些中间特征表示,学习多个分类器,并将这些预测与最终VIT分类器的预测相结合可以为对抗性攻击提供鲁棒性。测量各种预测之间的一致性也可以帮助检测对抗样本。对两种方式(胸部X射线和基础镜检查)进行的实验证明了SEVIT体系结构在灰色框中防御各种对抗性攻击的功效(攻击者对目标模型有充分的了解,但没有防御机制)设置。代码:https://github.com/faresmalik/sevit
translated by 谷歌翻译